15 research outputs found

    Morphological analysis of the Slovak language

    Get PDF
    This paper proposes a new statistic-based method of segmenting words by identification of a suffix. Ability to identify suffix can improve morphological analysis by allowing the classifier to assign tags to words previously unseen in the training corpus. Identified suffix of the word can be used to improve the accuracy of the part-of-speech tagging or other natural language processing task

    Categorization of unorganized text corpora for better domain-specific language modeling

    Get PDF
    This paper describes the process of categorization of unorganized text data gathered from the Internet to the in-domain and out-of-domain data for better domain-specific language modeling and speech recognition. An algorithm for text categorization and topic detection based on the most frequent key phrases is presented. In this scheme, each document entered into the process of text categorization is represented by a vector space model with term weighting based on computing the term frequency and inverse document frequency. Text documents are then classified to the in-domain and out-of-domain data automatically with predefined threshold using one of the selected distance/similarity measures comparing to the list of key phrases. The experimental results of the language modeling and adaptation to the judicial domain show significant improvement in the model perplexity about 19 % and decreasing of the word error rate of the Slovak transcription and dictation system about 5,54 %, relatively

    Use of Ethical Code in Decision Making by Managers in Ethical dilemmas in the Czech republic.

    No full text
    This thesis deals with the application of the Code of Ethics working through ethical dilemmas by management of companies in the Czech Republic. The main goal of this work is to identify the factors which determine if the Code of Ethics is applied or not in the business ethics environment. The qualitative research is based on semi-structured interviews held with 10 top management professionals from small to large Czech companies. The specialized program MAXQDA 2022 was used for analysis and appropriate interpretation of the obtained data. The data were analyzed using created codes divided into three main segments: ethical and moral reflection in personal and professional life of managers, work with an Ethical code and the main reasons for (dis)applying the Code of Ethics while solving dilemmas in working environment. The research points at the important role of educating management about the function and the meaning of ethics and ethical dilemmas in a broader context, the importance of experienced mentors and mentoring in the process of identification and working with ethical dilemmas of professionals involved in general. Personal connection with the company's ethics or more precisely the Code of Ethics seems to be another significant factor for understanding its meaning and importance in the questions and dilemmas of the ethic nature.Diplomová práce se zabývá využíváním etického kodexu v etických dilematech u manažerů českých firem. Hlavním cílem je identifikovat faktory, které determinují (ne)využívání etického kodexu v řešení etických dilemat v prostředí podnikatelské etiky. Výzkum spočívá v kvalitativních polostrukturovaných rozhovorech, které byli provedeny s deseti manažery středních a velkých českých firem. Pro analýzu a vhodnou interpretaci získaných dat byl využit specializovaný program MAXQDA 2022. Data byla analyzovány za pomoci vytvořených kódů rozdělených do tří hlavních segmentů: reflexe etiky a morálky v osobním i pracovním životě manažerů, práce s kodexem, a hlavní důvody (ne)využívání kodexu v řešení etických dilemat. Výzkum poukazuje na významnou roli edukace manažerů o podstatě a významu etiky a etických dilemat v pracovním prostředí v širším kontextu, důležitost zkušenějších mentorů a mentoringu obecně v procesu identifikace a práce s etickými dilematy pracovního charakteru. Jako další významný faktor se jeví osobní propojenost s etikou firmy, resp. s etickým kodexem ve smyslu pochopení jeho významu a důležitosti v otázkách a dilematech etického charakteru

    Economic and other factors determining the use of club memberships in fitness centers in the Czech Republic in 2015

    No full text
    Bakalářská práce je nasměrována do odvětví fitness průmyslu ČR, které patří mezi velmi dynamické a potenciální, ale zároveň i velmi přehlížené odvětví národního hospodářství. V této práci jasně poukazuji na nedostatečně rozvinutý, resp. zastaralý systém vedení českých fitness center na bázi jednorázových vstupů, což do značné míry determinuje současný nepřehledný, nedostatečně zmapovaný a nesystematický fitness průmysl v ČR. V teoretické části této práce tak modeluji možné varianty systému vedení fitness center na bázi klubových členství, které by byly reálně aplikovatelné do současných českých podmínek. Zároveň formuluji hlavní ekonomické a další faktory, které podmiňují návštěvníky fitness center ke koupi klubového členství, resp. jejich majitelů a provozovatelů k akceptování a zavedení systému klubového členství v daném fitness centru. V praktické části následně ověřuji, do jaké míry navrženy postupy a kritéria korelují se současnými podmínkami a mentalitou návštěvníků českých fitness center, resp. jejich majitelů a provozovatelů. Výsledkem této práce je tak reálný a do současných českých podmínek aplikovatelný model postupného zavádění klubových fitness členství, který (mj.) vytváří příznivé podmínky pro následnou kooperaci s dalšími odvětvími národního hospodářství ČR či mezinárodními asociacemi sdružujících fitness průmysl na celém světě.The bachelor thesis is primarily focused on the fitness industry section of the Czech Republic, which belongs to the most dynamic and potential, but also very much neglected sections of the national economy. This work clearly shows the underdeveloped, or rather obsolete managing system of Czech fitness centres based on single entries which considerably determines the current chaotic, poorly mapped and unsystematic fitness industry in the country. The theoretical part of the work presents some possible management techniques of fitness centres based on the club memberships that would be applicable to the current conditions of the Czech market. At the same time it reflects the main economic as well as other factors, which are conditioned by the fitness centre visitors in order to purchase a club membership, respectively, their owners and operators to the acceptance and introduction of club membership in a particular fitness centre. The practical part verifies to which extent the proposed procedures and criteria correlate with the current conditions and the mentality of visitors of the Czech fitness centres and also their owners and operators. The result of this work is to make a real model of gradual introduction of fitness club memberships applicable in current Czech conditions that create a good background for a consequent co-operation with the other sectors of the national economy of the Czech Republic or the international associations related to the fitness industry worldwide.Bakalárska práca je nasmerovaná do odvetvia fitness priemyslu ČR, ktoré patrí medzi veľmi dynamické a potenciálne, no zároveň aj veľmi prehliadané odvetvie národného hospodárstva. V tejto práci jasne poukazujem na nedostatočne rozvinutý, resp. zastaraný systém vedenia českých fitness centier na báze jednorazových vstupov, čo do značnej miery determinuje súčasný neprehľadný, nedostatočne zmapovaný a nesystematický fitness priemysel v ČR. V teoretickej časti tejto práce tak modelujem možné varianty systému vedenia fitness centier na báze klubových členstiev, ktoré by boli reálne aplikovateľné do súčasných českých podmienok. Zároveň formulujem hlavné ekonomické a ďalšie faktory, ktoré podmieňujú návštevníkov fitness centier ku kúpe klubového členstva, resp. ich majiteľov a prevádzkovateľov k akceptovaniu a zavedeniu systému klubového členstva v danom fitness centre. V praktickej časti následne overujem, do akej miery navrhnuté postupy a kritériá korelujú so súčasnými podmienkami a mentalitou návštevníkov českých fitness centier, resp. ich majiteľov a prevádzkovateľov. Výsledkom tejto práce je tak reálny a do súčasných českých podmienok aplikovateľný model postupného zavádzania klubových fitness členstiev, ktorý (mi.) vytvára priaznivé podmienky pre následnú kooperáciu s ďalšími odvetviami národného hospodárstva ČR či medzinárodnými asociáciami združujúcich fitness priemysel na celom svete

    Modeling of Slovak Language for Broadcast News Transcription

    No full text
    The paper describes recent progress in the development the Slovak language models for transcription of spontaneous speech such as broadcast news, educational talks and lectures, or meetings. This work extends previous research oriented on the automatic transcription of dictated speech and brings some new extensions for improving perplexity and robustness of the Slovak language models trained on the web-based and electronic language resources for being more precise in recognition of spontaneous speech. These improvements include better text preprocessing, document classification, class-based and filled pauses modeling, web-data augmentation and fast model adaptation to the target domain. Experiments have been performed on the four different evaluation data sets, including judicial and newspaper readings, broadcast news recordings and parliament proceedings with the Slovak transcription system. Preliminary results show significant decrease of the word error rate for multiple transcription system configurations of acoustic and language models

    Analysis of morph-based language modeling and speech recognition in Slovak

    Get PDF
    The inflection of the Slovak language causes a large number of unique word forms, which produces not only a large vocabulary, but also a number of out-of-vocabulary words. Morph-based language models solve this problem by decomposition of inflected word forms into small sub-word units and resolve the general problem of sparsity the training data. In this paper, we present several rule-based and data-driven approaches to the automatic segmentation of words into morphs. These data are later used in the modeling of the Slovak language for large vocabulary continuous speech recognition. Preliminary results show a significant decrease in the number of out-of-vocabulary words and reduction of resultant language model perplexity

    Survey of Automatic Spelling Correction

    No full text
    Automatic spelling correction has been receiving sustained research attention. Although each article contains a brief introduction to the topic, there is a lack of work that would summarize the theoretical framework and provide an overview of the approaches developed so far. Our survey selected papers about spelling correction indexed in Scopus and Web of Science from 1991 to 2019. The first group uses a set of rules designed in advance. The second group uses an additional model of context. The third group of automatic spelling correction systems in the survey can adapt its model to the given problem. The summary tables show the application area, language, string metrics, and context model for each system. The survey describes selected approaches in a common theoretical framework based on Shannon’s noisy channel. A separate section describes evaluation methods and benchmarks

    Review of Recent Trends in the Detection of Hate Speech and Offensive Language on Social Media

    No full text
    In the article, we describe recent trends in the detection of hate speech and offensive language on social media. We accord from the latest studies and scientific contributions. The article describes current trends and the most used methods in connection with the detection of hate speech and offensive language. At the same time, we focus on the importance of emoticons, hashtags, and swearing in the field of social networks. We point out the topicality of the selected topic, describe the next direction of our work, and suggest possible solutions to current problems in this field of research

    Unsupervised spelling correction for Slovak

    No full text
    This paper introduces a method to automatically propose and choose a correction for an incorrectly written word in a large text corpus written in Slovak. This task can be described as a process of finding the best matching sequence of correct words to a list of incorrectly spelled words, found in the input. Knowledge base of the classification system - statistics about sequences of correctly typed words and possible corrections for incorrectly typed words can be mathematically described as a hidden Markov model. The best matching sequence of correct words is found using Viterbi algorithm. The system will be evaluated on a manually corrected testing set
    corecore